【精彩论文】基于混合神经网络的电力调度文本事件抽取方法
基于混合神经网络的电力调度文本事件抽取方法
刘赫1, 皮俊波1, 宋鹏程1, 赵翰林1, 张越2,3, 刘显壮1
(1. 国家电网有限公司 国家电力调度控制中心,北京 100031; 2. 南瑞集团有限公司(国网电力科学研究院有限公司),江苏 南京 211106; 3. 北京科东电力控制系统有限责任公司,北京 100192)
引文信息
刘赫, 皮俊波, 宋鹏程, 等. 基于混合神经网络的电力调度文本事件抽取方法[J]. 中国电力, 2022, 55(9): 105-110, 120.
LIU He, PI Junbo, SONG Pengcheng, et al. An event extraction method for power dispatching text based on hybrid neural network[J]. Electric Power, 2022, 55(9): 105-110, 120.
本文基于变换器双向编码器表征技术(bidirectional encoder representations from transformers,BERT)训练的动态词向量表示预案文本特征。基于双向长短期记忆网络-条件随机场训练预案实体特征和触发词特征。基于文本卷积神经网络(text convolutional neural network,TextCNN)训练预案触发词与实体间的关系特征,建立以预案触发词为中心的事件抽取模型,从而提升电力调度文本事件抽取准确率。
故障处置预案随电网运行方式、季节等因素变化频繁,各地区调控中心每年都会编制迎峰度夏预案。故障处置预案包含电网在各种运行方式下重大故障和处置方式,对保障电网安全稳定运行至关重要。现行故障处置预案是调度员凭借工作经验离线进行编制。电网故障处置措施需要结合电网运行方式进行校核,对不合适的处置措施进行辅助修改。对于校核后的故障处置预案,可以支撑故障处置预案在线监视和故障处置预案智能推送。故障处置预案校核的基础是预案电子化,需要得到预案事件种类、操作对象名称、操作对象程度等电子化信息进行校核。故障处置预案构成如图1所示。故障处置预案文本以非结构化形式存在。在预案校核过程中,需要对故障处置措施以及故障后运行方式等内容进行解析,生成预案解析后的信息。根据故障处置预案应用需求,本文提出了以预案执行动词为触发词的预案事件要素抽取方法。
图1 故障处置预案构成
Fig.1 Composition of fault handling plan
采用TextCNN网络[23-25]训练电力调度文本不同实体对与实体关系标签的映射关系,实现对实体关系的识别和分类。具体结构如图2所示。
图2 TextCNN网络结构
Fig.2 Network structure of TextCNN
电力文本事件抽取混合神经网络由BERT、BiLSTM-CRF、TextCNN共3种神经网络构成,基于BERT预训练的动态词向量将电力专业文本转化为可计算的词向量,采用BiLSTM-CRF网络框架建立预案实体识别模型,采用TextCNN建立预案实体关系抽取模型。网络结构如图3所示。在图3中,xn、hn、cn分别为第n个输入字符、字符隐含层向量、信息记忆单元向量。
图3 混合神经网络结构
Fig.3 Hybrid neural network structure
表1 预案事件特征分析结果
Table 1 Characteristic analysis results of plan events
以执行动作为触发词的预案事件抽取方法可以解决预案专业语言表述倒装、语序混杂以及电力设备实体表述不规范等问题。从表1中可以看出,预案事件中的动词位置不固定,导致语法各成分位置不固定,基于规则和机器学习方法建立的实体识别模型难以较好地解析预案。本文所提以触发词为中心的预案识别方法首先识别触发词位置和各实体名词位置,然后通过识别触发词与各实体名词的语法关系,可以将预案事件中各成分准确识别出来。以“控制南湖电厂出力不超过100万kW”典型预案为例,首先识别“控制”触发词和“南湖电厂”“不超过100万kW”实体名词,然后识别“控制”与“南湖电厂”间关系为操作对象,“控制”与“不超过100万kW”间关系为操作对象后置状语,只要在触发词识别准确的情况下,可以有效地实现预案事件抽取。对于电力设备实体表述不规范情况,如“东湖I、II线”的实体名词包含2个电力实体“东湖I线”“东湖II线”,先用模型识别“东湖I、II线”整个实体,再使用规则进行实体拆分。具体预案标记实例如图4所示。
图4 故障处置预案文本标记实例
Fig.4 Marking example of fault handling plan text
采用某调控中心历史故障处置预案作为研究对象,将每个预案的标题、稳定控制要求和紧急控制阶段处置措施对应的预案文本作为试验数据。通过本文方法标记2种预案实体和5种实体关系,共标记1 000个预案语句,每个预案语句中有1个触发词,生成预案实体4 110个,生成预案实体关系3 110个,其中3 690个实体和2 790个实体关系作为训练样本,剩余420个实体和320个实体关系作为测试样本。本文基于Pytorch框架搭建算法,方法的训练环境为Intel处理器,CPU运行内存为128 GB,GPU 为NVIDIA 16 GB。
本文采用典型的精确率Pre 、召回率 Rec 和评价值F1作为评价故障处置预案实体和实体关系识别结果的评价指标,即
表2 预案实体识别效果
Table 2 Effect of plan entity recognition
表3 预案实体关系抽取效果
Table 3 Effect of plan entity relation extraction
将本文方法与基于正则表达式、基于word2vec词向量的BiLSTM-CRF+TextCNN所建立的预案事件抽取模型对比,各模型对于测试样本2种预案实体和5种预案实体关系识别的平均F1如表4所示。将各模型预案实体识别和实体关系平均精确率、召回率和评价值对比绘制如图5所示。
表4 各模型预案事件识别效果
Table 4 Plan event recognition effects of various models
图5 预案事件抽取效果
Fig.5 Comparison of plan event extraction effects
结合表4和图5可以看出,本文所提模型的实体识别和实体关系抽取效果要明显优于其他模型。采用上述试验中典型故障处置预案文本验证各模型效果,对于“xx站1#变压器”“xx站1#主变”“xx站1#变”3个含义相同的预案实体,正则表达式模型难以有效地识别实体的边界线,导致实体识别出现错误。对于“控制南湖电厂出力不超过100万kW”和“南湖电厂出力调整范围不能高于100万kW”2个语义相同但表述不同的文本,基于正则表达式的模型可以预配置触发词识别“控制”和“调整”,但很难根据语法识别触发词与“南湖电厂”名词实体的关系为object,导致预案事件识别错误,故基于正则表达式的模型难以应对多样性表述的预案文本,其他2种模型通过训练标记样本,能够较为准确地抽取事件要素,泛化能力优于正则表达式。与以word2vec为词向量的模型相比,以BERT为词向量的模型实体识别和实体关系抽取的F1分别高出2.86个百分点和4.98个百分点,说明BERT模型比word2vec词向量模型更能够提取电力调度专业文本语义特征,更适合对电力调度文本进行编码。
(责任编辑 杨彪)
作者介绍
刘赫(1990—),男,硕士,工程师,从事电力系统调度控制研究,E-mail:liu-he@sgcc.com.cn;
★
张越(1989—),男,通信作者,硕士,工程师,从事人工智能在电力系统的应用研究,E-mail:zhangyue@sgepri.sgcc.com.cn.
往期回顾
编辑:于静茹审核:方彤
根据国家版权局最新规定,纸媒、网站、微博、微信公众号转载、摘编《中国电力》编辑部的作品,转载时要包含本微信号名称、二维码等关键信息,在文首注明《中国电力》原创。个人请按本微信原文转发、分享。欢迎大家转载分享。